\documentclass{article}
\usepackage{geometry}
\geometry{a4paper, margin=1in}
\usepackage{amsmath}
\usepackage{amssymb}
\usepackage{graphicx}
\usepackage{background}
\usepackage[UTF8]{ctex}


\backgroundsetup{
  scale=2.5, 
  color=black,
  opacity=0.08, 
  angle=0,
  position=current page.center,
  contents={\Huge 由ZeRui收集整理}
}

\begin{document}

\section*{概率论与数理统计复习知识点}

\section{第一章}
\begin{enumerate}
    \item 概率的定义是：概率是事件发生可能性的度量。\begin{itemize}
        \item 概率的性质有：非负性、归一性、可加性。
        \item 对立事件的概率计算公式：\( P(\overline{A}) = 1 - P(A) \)。（备注：题问中出现“至少”时可考虑。例外：匹配问题）
    \end{itemize}
    \item 加法公式：
    \begin{itemize}
        \item \( P(A \cup B) = P(A) + P(B) - P(A \cap B) \)
        \item \( P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(A \cap B) - P(A \cap C) - P(B \cap C) + P(A \cap B \cap C) \)。（备注：题问中出现“或”时，或者多个事件至少发生一个时，应会将问题表示成多个事件的并）
        \item 若事件 \( A, B \) 不相容，则加法公式变为：\( P(A \cup B) = P(A) + P(B) \)
        \item 若事件 \( A, B \) 相互独立，则加法公式变为：\( P(A \cup B) = P(A) + P(B) - P(A)P(B) \)
    \end{itemize}
    \item 条件概率定义：\( P(A|B) = \frac{P(A \cap B)}{P(B)} \)。计算条件概率的两种典型方法是：定义法和乘法公式法。
    \item 乘法公式：
    \begin{itemize}
        \item \( P(A \cap B) = P(A|B)P(B) \)
        \item \( P(A \cap B \cap C) = P(A|B \cap C)P(B|C)P(C) \)。（备注：题问中出现“且”时，应会将问题表示成多个事件的交，乘法公式是将同时发生的事件转换为有序发生来方便分析和计算）
    \end{itemize}
    \item 全概率公式：设 \( B_1, B_2, \dots, B_n \) 是样本空间 \( \Omega \) 的一个划分，则 \( P(A) = \sum_{i=1}^{n} P(A|B_i)P(B_i) \)。（备注：题中求一个复杂事件的概率，但该事件在不同原因因素下发生的概率不一样，此时通常要用到全概率公式来综合考虑所有可能导致事件的因素）
    \item 贝叶斯公式：\( P(B_i|A) = \frac{P(A|B_i)P(B_i)}{\sum_{j=1}^{n} P(A|B_j)P(B_j)} \)。（备注：题中已告知某事件（结果）已经发生，然后反求另一个事件（原因）的概率，此时通常涉及到的本质是条件概率）
    \item 独立性：当 \( A, B, C \) 相互独立时，则有 \( P(A \cap B) = P(A)P(B) \)，\( P(A \cap B \cap C) = P(A)P(B)P(C) \)。
    \item 古典概型与几何概型的计算。（古典概型主要是掌握有利场合与样本点总数的计数，几何概型主要是学会分析做图，当然几何概型也可以联系后续内容的二维随机变量）
    \item 古典概型计算的主要模型有：抛硬币、掷骰子、抽球、分球入盒等。
    \item 古典概型的典型问题及其计算的技巧包括：排列组合的应用、对称性分析等。
    \item 自行补充其他掌握上存在问题的知识点。
\end{enumerate}

\section{第二章}
\begin{enumerate}
    \item 随机变量 \( X \) 的分布函数定义：\( F(x) = P(X \leq x) \)。
    \item 随机变量 \( X \) 的分布函数 \( F(x) \) 应满足的条件（本质特征、基本性质）：
    \begin{itemize}
        \item \( F(x) \) 是非减函数，即若 \( x_1 < x_2 \)，则 \( F(x_1) \leq F(x_2) \)。
        \item \( \lim_{x \to -\infty} F(x) = 0 \)，\( \lim_{x \to +\infty} F(x) = 1 \)。
        \item \( F(x) \) 是右连续函数，即 \( \lim_{y \downarrow x} F(y) = F(x) \)。
    \end{itemize}
    \item 离散型随机变量 \( X \) 的定义：随机变量 \( X \) 取有限个或可数无穷多个值。
    \item 离散型随机变量分布律 \( \{p_k = P(X = x_k)\} \) 应满足的条件（本质特征）：
    \begin{itemize}
        \item \( p_k \geq 0 \) 对所有 \( k \) 成立。
        \item \( \sum_{k} p_k = 1 \)。
    \end{itemize}
    \item 离散型随机变量 \( X \) 分布律与分布函数 \( F(x) \) 之间的相互计算：
    \begin{itemize}
        \item 从分布律到分布函数：\( F(x) = \sum_{x_k \leq x} p_k \)。
        \item 从分布函数到分布律：\( p_k = F(x_k) - F(x_k^-) \)，其中 \( x_k^- \) 表示 \( x_k \) 的左极限。
    \end{itemize}
    \item 连续型随机变量 \( X \) 的定义：随机变量 \( X \) 的取值范围是连续的，且存在一个非负函数 \( f(x) \)，使得 \( F(x) = \int_{-\infty}^{x} f(t) \, dt \)。
    \item 连续型随机变量 \( X \) 的密度函数 \( f(x) \) 应满足的条件：
    \begin{itemize}
        \item \( f(x) \geq 0 \) 对所有 \( x \) 成立。
        \item \( \int_{-\infty}^{+\infty} f(x) \, dx = 1 \)。
    \end{itemize}
    \item 连续型随机变量 \( X \) 的密度函数 \( f(x) \) 与分布函数 \( F(x) \) 之间的关系：
    \begin{itemize}
        \item \( F(x) = \int_{-\infty}^{x} f(t) \, dt \)。
        \item \( f(x) = F'(x) \)（若 \( F(x) \) 在 \( x \) 处可导）。
    \end{itemize}
    \item 0--1 两点分布的分布律：
    \begin{itemize}
        \item \( P(X = 0) = 1 - p \)。
        \item \( P(X = 1) = p \)，其中 \( 0 < p < 1 \)。
    \end{itemize}
    \item 二项分布 \( B(n, p) \) 的分布律：
    \begin{itemize}
        \item \( P(X = k) = {\binom{n}{k}} p^k (1 - p)^{n - k} \),\( k = 0, 1, \dots, n \)。
        \item 其中 \( n \) 是试验次数，\( p \) 是每次试验成功的概率。
    \end{itemize}
    \item 泊松分布 \( P(\lambda) \) 的分布律：
    \begin{itemize}
        \item \( P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} \),\( k = 0, 1, 2, \dots \)。
        \item 其中 \( \lambda > 0 \) 是单位时间（或单位面积）内随机事件发生的平均次数。
    \end{itemize}
    \item 均匀分布 \( U(a, b) \) 的定义：随机变量 \( X \) 在区间 \( (a, b) \) 上均匀分布。
    \begin{itemize}
        \item 其分布函数为：
        \[
        F(x) = \begin{cases} 
        0, & x < a \\
        \frac{x - a}{b - a}, & a \leq x \leq b \\
        1, & x > b 
        \end{cases}
        \]
        \item 其密度函数为：
        \[
        f(x) = \begin{cases} 
        \frac{1}{b - a}, & a \leq x \leq b \\
        0, & \text{其他}
        \end{cases}
        \]
    \end{itemize}
    \item 指数分布 \( Exp(\lambda) \) 的定义：随机变量 \( X \) 的密度函数为 \( f(x) = \lambda e^{-\lambda x} \)，\( x \geq 0 \)。
    \begin{itemize}
        \item 其分布函数为：
        \[
        F(x) = \begin{cases} 
        1 - e^{-\lambda x}, & x \geq 0 \\
        0, & x < 0 
        \end{cases}
        \]
        \item 其密度函数为：
        \[
        f(x) = \begin{cases} 
        \lambda e^{-\lambda x}, & x \geq 0 \\
        0, & x < 0 
        \end{cases}
        \]
    \end{itemize}
    \item 正态分布 \( N(\mu, \sigma^2) \) 的定义：随机变量 \( X \) 的密度函数为
    \[
    f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}
    \]
    \begin{itemize}
        \item 标准正态分布 \( N(0,1) \) 的定义：随机变量 \( Z \) 的密度函数为
        \[
        \phi(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}
        \]
        \item 一般正态分布 \( N(\mu, \sigma^2) \) 和标准正态分布 \( N(0,1) \) 的密度函数和分布函数及其图像的有关性质：
        \begin{itemize}
            \item 密度函数 \( f(x) \) 关于 \( x = \mu \) 对称。
            \item 分布函数 \( \Phi(z) \) 是标准正态分布的累积分布函数，满足 \( \Phi(-z) = 1 - \Phi(z) \)。
            \item 计算一般正态分布事件概率的方法是通过标准化：若 \( X \sim N(\mu, \sigma^2) \)，则 \( Z = \frac{X - \mu}{\sigma} \sim N(0,1) \)。
        \end{itemize}
    \end{itemize}
    \item 离散型随机变量 \( X \) 的概率计算基本原理是 \( P(a < X \leq b) = \sum_{a < x_k \leq b} p_k \)。
    \item 连续型随机变量 \( X \) 的概率计算基本原理是 \( P(a < X \leq b) = \int_{a}^{b} f(x) \, dx \)。
    \item 计算随机变量函数 \( Y = g(X) \) 的密度函数的主要方法有：
    \begin{itemize}
        \item 变换法：若 \( Y = g(X) \) 是单调函数，则 \( f_Y(y) = f_X(g^{-1}(y)) \left| \frac{d}{dy} g^{-1}(y) \right| \)。
        \item 分布函数法：先求 \( F_Y(y) = P(Y \leq y) \)，再求导得到 \( f_Y(y) \)。
    \end{itemize}
    \item 离散型随机变量 \( X \) 函数 \( Y = g(X) \) 的分布律的求解过程：
    \begin{itemize}
        \item 找出所有可能的 \( Y \) 的值 \( y_k = g(x_k) \)。
        \item 计算每个 \( y_k \) 对应的概率 \( P(Y = y_k) = \sum_{x_k: g(x_k) = y_k} p_k \)。
    \end{itemize}
    \item \( X \) 是连续型随机变量，而随机变量 \( Y = g(X) \) 是离散型时，\( Y = g(X) \) 的分布律求解过程：
    \begin{itemize}
        \item 找出所有可能的 \( Y \) 的值 \( y_k = g(x_k) \)。
        \item 计算每个 \( y_k \) 对应的概率 \( P(Y = y_k) = \int_{\{x: g(x) = y_k\}} f_X(x) \, dx \)。
    \end{itemize}
    \item 连续型随机变量 \( X \) 对上课例题以及课后习题中一些典型类型的函数 \( Y = g(X) \) 总结计算密度函数的方法过程，例如：
    \begin{itemize}
        \item \( Y = 2X \)：\( f_Y(y) = \frac{1}{2} f_X\left(\frac{y}{2}\right) \)。
        \item \( Y = \ln X \)：\( f_Y(y) = f_X(e^y) e^y \)。
        \item \( Y = e^X \)：\( f_Y(y) = f_X(\ln y) \frac{1}{y} \)。
        \item \( Y = \cos X \) 或 \( Y = \sin X \)：需要分段处理，考虑函数的周期性和单调性。
        \item \( Y = aX + b \)：\( f_Y(y) = \frac{1}{|a|} f_X\left(\frac{y - b}{a}\right) \)。
    \end{itemize}
    \item 自行补充其他掌握上存在问题的知识点。
\end{enumerate}

\section{第三章}
\begin{enumerate}
    \item 二维随机变量 \( (X, Y) \) 的分布函数定义：\( F(x, y) = P(X \leq x, Y \leq y) \)。
    \item 二维随机变量 \( (X, Y) \) 的分布函数 \( F(x, y) \) 应满足的条件（性质，本质特征）：
    \begin{itemize}
        \item \( F(x, y) \) 是非减函数，即若 \( x_1 \leq x_2 \) 且 \( y_1 \leq y_2 \)，则 \( F(x_1, y_1) \leq F(x_2, y_2) \)。
        \item \( \lim_{x \to -\infty} F(x, y) = 0 \)，\( \lim_{y \to -\infty} F(x, y) = 0 \)，\( \lim_{x \to +\infty, y \to +\infty} F(x, y) = 1 \)。
        \item \( F(x, y) \) 是右连续函数，即 \( \lim_{x' \downarrow x, y' \downarrow y} F(x', y') = F(x, y) \)。
    \end{itemize}
    \item 二维离散型随机变量 \( (X, Y) \) 的定义：随机变量 \( X \) 和 \( Y \) 取有限个或可数无穷多个值。
    \item 二维离散型随机变量分布律 \( \{p_{ij} = P(X = x_i, Y = y_j)\} \) 应满足的条件（本质特征）及其计算法步骤：
    \begin{itemize}
        \item \( p_{ij} \geq 0 \) 对所有 \( i, j \) 成立。
        \item \( \sum_{i}\sum_{j} p_{ij} = 1 \)。
        \item 计算法步骤：列出所有可能的 \( (x_i, y_j) \) 组合及其对应的概率 \( p_{ij} \)。
    \end{itemize}
    \item 二维连续型随机变量 \( (X, Y) \) 的定义：随机变量 \( X \) 和 \( Y \) 的取值范围是连续的，且存在一个非负函数 \( f(x, y) \)，使得 \( F(x, y) = \int_{-\infty}^{x} \int_{-\infty}^{y} f(u, v) \, dv \, du \)。
    \item 二维连续型随机变量 \( (X, Y) \) 的密度函数 \( f(x, y) \) 应满足的条件（本质特征）：
    \begin{itemize}
        \item \( f(x, y) \geq 0 \) 对所有 \( (x, y) \) 成立。
        \item \( \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) \, dx \, dy = 1 \)。
    \end{itemize}
    \item 利用密度函数 \( f(x, y) \) 计算二维连续型随机变量有关事件 \( (X, Y) \in D \) 的概率的计算原理和主要步骤是：
    \begin{itemize}
        \item \( P((X, Y) \in D) = \iint_{D} f(x, y) \, dx \, dy \)。
        \item 主要步骤：确定积分区域 \( D \)，然后计算二重积分。
    \end{itemize}
    \item 已知二维离散型随机变量 \( (X, Y) \) 的分布律 \( \{p_{ij} = P(X = x_i, Y = y_j)\} \)，则
    \begin{itemize}
        \item \( X \) 的边缘分布律为：\( p_{i\cdot} = \sum_{j} p_{ij} \)。
        \item \( Y \) 的边缘分布律为：\( p_{\cdot j} = \sum_{i} p_{ij} \)。
    \end{itemize}
    \item 已知二维连续型随机变量 \( (X, Y) \) 的密度函数 \( f(x, y) \)，则
    \begin{itemize}
        \item \( X \) 的边缘密度为：\( f_X(x) = \int_{-\infty}^{+\infty} f(x, y) \, dy \)。
        \item \( Y \) 的边缘密度为：\( f_Y(y) = \int_{-\infty}^{+\infty} f(x, y) \, dx \)。
    \end{itemize}
    \item 已知二维离散型随机变量 \( (X, Y) \) 的分布律 \( \{p_{ij} = P(X = x_i, Y = y_j)\} \)，则
    \begin{itemize}
        \item 在 \( X = x_i \) 的条件下，\( Y \) 的条件分布律为：\( p_{j|i} = \frac{p_{ij}}{p_{i\cdot}} \)。
        \item 在 \( Y = y_j \) 的条件下，\( X \) 的条件分布律为：\( p_{i|j} = \frac{p_{ij}}{p_{\cdot j}} \)。
    \end{itemize}
    \item 已知二维连续型随机变量 \( (X, Y) \) 的密度函数 \( f(x, y) \)，则
    \begin{itemize}
        \item 在 \( X = x \) 的条件下，\( Y \) 的条件密度为：\( f_{Y|X}(y|x) = \frac{f(x, y)}{f_X(x)} \)。
        \item 在 \( Y = y \) 的条件下，\( X \) 的条件密度为：\( f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)} \)。
    \end{itemize}
    \item 随机变量 \( X \) 与 \( Y \) 相互独立的定义是：\( P(X = x, Y = y) = P(X = x)P(Y = y) \)，判断随机变量 \( X \) 与 \( Y \) 相互独立的充要条件和主要方法是：
    \begin{itemize}
        \item 对于离散型随机变量：\( p_{ij} = p_{i\cdot} p_{\cdot j} \)。
        \item 对于连续型随机变量：\( f(x, y) = f_X(x) f_Y(y) \)。
    \end{itemize}
    \item 联合分布、边缘分布和条件分布之间的关系是：
    \begin{itemize}
        \item 联合分布函数 \( F(x, y) \) 可以通过边缘分布函数 \( F_X(x) \) 和 \( F_Y(y) \) 以及条件分布函数 \( F_{Y|X}(y|x) \) 或 \( F_{X|Y}(x|y) \) 来表示。
        \item 边缘分布函数可以通过联合分布函数积分得到。
        \item 条件分布函数可以通过联合分布函数和边缘分布函数的比值得到。
    \end{itemize}
    \item 计算二维随机变量 \( (X, Y) \) 的函数 \( Z = g(X, Y) \) 的分布有以下方法：
    \begin{itemize}
        \item 分布函数法：先求 \( F_Z(z) = P(Z \leq z) = P(g(X, Y) \leq z) \)，再求导得到密度函数 \( f_Z(z) \)。
        \item 变换法：若 \( g(X, Y) \) 是可逆的，可以通过雅可比行列式计算密度函数。
    \end{itemize}
    \item 两个随机变量变换的分布有关定理是：
    \begin{itemize}
        \item 若 \( (U, V) = (g_1(X, Y), g_2(X, Y)) \) 是可逆变换，则可以通过雅可比行列式计算 \( (U, V) \) 的联合密度函数。
    \end{itemize}
    \item 利用变换定理计算两个连续型随机变量和 \( X + Y \) 的密度函数的基本原理是：
    \begin{itemize}
        \item 卷积公式：若 \( X \) 和 \( Y \) 相互独立，则 \( f_{X+Y}(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z - x) \, dx \)。
    \end{itemize}
    \item 计算两个随机变量和 \( X + Y \) 的分布律（离散型）、密度函数（连续型）的计算公式分别为：
    \begin{itemize}
        \item 若 \( X \) 和 \( Y \) 相互独立，则
        \[
        P(X + Y = z) = \sum_{x} P(X = x) P(Y = z - x)
        \]
        \[
        f_{X+Y}(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z - x) \, dx
        \]
    \end{itemize}
    \item 利用变换定理两个连续型随机变量商 \( \frac{X}{Y} \) 的密度函数的基本原理是：
    \begin{itemize}
        \item 通过变换 \( U = \frac{X}{Y} \)，\( V = Y \)，利用雅可比行列式计算 \( f_{U,V}(u, v) \)，再对 \( V \) 积分得到 \( f_U(u) \)。
    \end{itemize}
    \item 两个连续型随机变量商 \( \frac{X}{Y} \) 的密度函数的计算公式为：
    \[
    f_{\frac{X}{Y}}(z) = \int_{-\infty}^{+\infty} |v| f_X(zv) f_Y(v) \, dv
    \]
    \item 两个随机变量的函数 \( \max\{X, Y\} \)，\( \min\{X, Y\} \) 分布函数和密度函数计算的基本原理为：
    \begin{itemize}
        \item 分布函数：
        \[
        F_{\max}(z) = P(\max\{X, Y\} \leq z) = P(X \leq z, Y \leq z) = F_X(z) F_Y(z)
        \]
        \[
        F_{\min}(z) = 1 - P(\min\{X, Y\} > z) = 1 - [1 - F_X(z)][1 - F_Y(z)]
        \]
        \item 密度函数：
        \[
        f_{\max}(z) = \frac{d}{dz} F_{\max}(z) = f_X(z) F_Y(z) + f_Y(z) F_X(z)
        \]
        \[
        f_{\min}(z) = \frac{d}{dz} F_{\min}(z) = f_X(z)[1 - F_Y(z)] + f_Y(z)[1 - F_X(z)]
        \]
    \end{itemize}
    \item 设 \( X_1, X_2, \dots, X_n \) 相互独立，且 \( X_i \sim F_i(x) \)，则
    \begin{itemize}
        \item \( \min\{X_1, X_2, \dots, X_n\} \) 和 \( \max\{X_1, X_2, \dots, X_n\} \) 的分布函数分别为：
        \[
        F_{\min}(z) = 1 - \prod_{i=1}^{n} [1 - F_i(z)]
        \]
        \[
        F_{\max}(z) = \prod_{i=1}^{n} F_i(z)
        \]
        \item 设 \( X_1, X_2, \dots, X_n \) 相互独立，且 \( X_i \) 的密度函数为 \( f_i(x) \)，则 \( \min\{X_1, X_2, \dots, X_n\} \) 和 \( \max\{X_1, X_2, \dots, X_n\} \) 的密度函数分别为：
        \[
        f_{\min}(z) = \sum_{i=1}^{n} f_i(z) \prod_{j \neq i} [1 - F_j(z)]
        \]
        \[
        f_{\max}(z) = \sum_{i=1}^{n} f_i(z) \prod_{j \neq i} F_j(z)
        \]
    \end{itemize}
    \item 随机变量 \( (X, Y) \sim f(x, y) \)，变换为 \( (U, V) = (g_1(X, Y), g_2(X, Y)) \)，则计算 \( f_{U,V}(u, v) \) 的方法是：
    \begin{itemize}
        \item 利用雅可比行列式：
        \[
        f_{U,V}(u, v) = f_{X,Y}(x(u, v), y(u, v)) |J|
        \]
        其中 \( J \) 是变换的雅可比行列式。
    \end{itemize}
    \item 设连续型随机变量 \( (X, Y) \sim f(x, y) \)，在 \( Y = y \) 的条件下，\( X \) 的条件密度 \( f_{X|Y}(x|y) \)，则
    \begin{itemize}
        \item 概率 \( P((X, Y) \in D) \) 的一般计算公式为：
        \[
        P((X, Y) \in D) = \iint_{D} f(x, y) \, dx \, dy
        \]
        \item 条件概率 \( P(X \in C|Y = y) \) 的一般计算公式为：
        \[
        P(X \in C|Y = y) = \int_{C} f_{X|Y}(x|y) \, dx
        \]
        \item 条件概率 \( P(X \in D_1|Y \in D_2) \) 的一般计算公式为：
        \[
        P(X \in D_1|Y \in D_2) = \frac{\iint_{D_1 \times D_2} f(x, y) \, dx \, dy}{\int_{D_2} f_Y(y) \, dy}
        \]
    \end{itemize}
    \item 已知二维连续型随机变量 \( (X, Y) \) 的密度函数 \( f(x, y) \)，则
    \begin{itemize}
        \item \( P(X \leq x|Y = y) \) 的计算方法为：
        \[
        P(X \leq x|Y = y) = \int_{-\infty}^{x} f_{X|Y}(t|y) \, dt
        \]
        \item \( P(x_1 \leq X \leq x_2|Y = y) \) 的计算方法为：
        \[
        P(x_1 \leq X \leq x_2|Y = y) = \int_{x_1}^{x_2} f_{X|Y}(t|y) \, dt
        \]
    \end{itemize}
    \item 二维正态分布的五个参数分别是：均值 \( \mu_X \)，\( \mu_Y \)，方差 \( \sigma_X^2 \)，\( \sigma_Y^2 \)，相关系数 \( \rho \)。
    \item 二维正态分布的边缘分布、独立性特殊之处有：
    \begin{itemize}
        \item 边缘分布：\( X \sim N(\mu_X, \sigma_X^2) \)，\( Y \sim N(\mu_Y, \sigma_Y^2) \)。
        \item 独立性：若 \( \rho = 0 \)，则 \( X \) 和 \( Y \) 相互独立。
    \end{itemize}
    \item 二维正态分布的线性组合有何特点：
    \begin{itemize}
        \item 若 \( (X, Y) \sim N(\mu_X, \mu_Y, \sigma_X^2, \sigma_Y^2, \rho) \)，则 \( aX + bY \) 也服从正态分布，其均值为 \( a\mu_X + b\mu_Y \)，方差为 \( a^2\sigma_X^2 + b^2\sigma_Y^2 + 2ab\rho\sigma_X\sigma_Y \)。
    \end{itemize}
    \item 自行补充其他掌握上存在问题的知识点。
\end{enumerate}

\section{第四章}
\begin{enumerate}
    \item 设离散型随机变量 \( X \) 的分布律为 \( \{p_k = P(X = x_k)\} \)，则其期望 \( E(X) = \sum_{k} x_k p_k \)。
    \item 设连续型随机变量 \( X \) 的密度函数为 \( f(x) \)，则其期望 \( E(X) = \int_{-\infty}^{+\infty} x f(x) \, dx \)。
    \item 数学期望的性质包括：
    \begin{itemize}
        \item \( E(aX + b) = aE(X) + b \)。
        \item \( E(X + Y) = E(X) + E(Y) \)。
        \item \( E(c) = c \)，其中 \( c \) 是常数。
    \end{itemize}
    \item \( E(X + Y) = E(X) + E(Y) \)，\( E\left(\sum_{i=1}^{n} a_i X_i\right) = \sum_{i=1}^{n} a_i E(X_i) \)。
    \item 若随机变量 \( X \) 与 \( Y \) 相互独立，则 \( E(XY) = E(X)E(Y) \)。
    \item 随机变量 \( X \) 的方差的定义为：\( D(X) = E[(X - E(X))^2] \)，计算的主要方法有：
    \begin{itemize}
        \item \( D(X) = E(X^2) - [E(X)]^2 \)。
        \item 对于离散型随机变量：\( D(X) = \sum_{k} (x_k - E(X))^2 p_k \)。
        \item 对于连续型随机变量：\( D(X) = \int_{-\infty}^{+\infty} (x - E(X))^2 f(x) \, dx \)。
    \end{itemize}
    \item 方差的性质包括：
    \begin{itemize}
        \item \( D(aX + b) = a^2 D(X) \)。
        \item \( D(X + Y) = D(X) + D(Y) + 2 \text{Cov}(X, Y) \)。
        \item \( D(X) \geq 0 \)，且 \( D(X) = 0 \) 当且仅当 \( X \) 是常数。
    \end{itemize}
    \item 设离散型随机变量 \( X \) 的分布律为 \( \{p_k = P(X = x_k)\} \)，则其方差 \( D(X) = \sum_{k} (x_k - E(X))^2 p_k \)。
    \item 设连续型随机变量 \( X \) 的密度函数为 \( f(x) \)，则其方差 \( D(X) = \int_{-\infty}^{+\infty} (x - E(X))^2 f(x) \, dx \)。
    \item \( D(X + Y) = D(X) + D(Y) + 2 \text{Cov}(X, Y) \)，\( D(X - Y) = D(X) + D(Y) - 2 \text{Cov}(X, Y) \)。
    \item 若随机变量 \( X \) 与 \( Y \) 相互独立，则 \( D(X + Y) = D(X) + D(Y) \)，\( D(X - Y) = D(X) + D(Y) \)。
    \item 随机变量 \( X \) 的三个数字特征 \( E(X) \)，\( D(X) \)，\( E(X^2) \) 之间的关系是：
    \[
    E(X^2) = D(X) + [E(X)]^2
    \]
    \item 设 \( a \) 与 \( b \) 是常数，则 \( E(aX + b) = aE(X) + b \)，\( D(aX + b) = a^2 D(X) \)。
    \item 设 \( X \) 服从参数为 \( p \) 的 0-1 两点分布，则 \( E(X) = p \)，\( D(X) = p(1 - p) \)。
    \item 设 \( X \sim B(n, p) \)，则 \( E(X) = np \)，\( D(X) = np(1 - p) \)。
    \item 设 \( X \sim P(\lambda) \)，则 \( E(X) = \lambda \)，\( D(X) = \lambda \)。
    \item 设 \( X \sim U(a, b) \)，则 \( E(X) = \frac{a + b}{2} \)，\( D(X) = \frac{(b - a)^2}{12} \)。
    \item 设 \( X \sim Exp(\lambda) \)，则 \( E(X) = \frac{1}{\lambda} \)，\( D(X) = \frac{1}{\lambda^2} \)。
    \item 设 \( X \sim N(\mu, \sigma^2) \)，则 \( E(X) = \mu \)，\( D(X) = \sigma^2 \)。
    \item 设离散型随机变量 \( X \) 的分布律为 \( \{p_k = P(X = x_k)\} \)，\( y = g(x) \) 为普通函数，则 \( E(g(X)) = \sum_{k} g(x_k) p_k \)。
    \item 设连续型随机变量 \( X \) 的密度函数为 \( f(x) \)，\( y = g(x) \) 为普通函数，则 \( E(g(X)) = \int_{-\infty}^{+\infty} g(x) f(x) \, dx \)。
    \item 设离散型随机变量 \( (X, Y) \) 的分布律为 \( \{p_{ij} = P(X = x_i, Y = y_j)\} \)，则 \( E(g(X, Y)) = \sum_{i}\sum_{j} g(x_i, y_j) p_{ij} \)。
    \item 设连续型随机变量 \( (X, Y) \) 的密度函数为 \( f(x, y) \)，\( z = g(x, y) \) 为普通函数，则 \( E(g(X, Y)) = \iint_{-\infty}^{+\infty} g(x, y) f(x, y) \, dx \, dy \)。
    \item 设 \( X \) 的数学期望和方差分别为 \( E(X) = \mu \)，\( D(X) = \sigma^2 \)，则由切比雪夫不等式有，对任意的 \( \epsilon > 0 \)，
    \[
    P(|X - \mu| < \epsilon) \geq 1 - \frac{\sigma^2}{\epsilon^2}
    \]
    \item \( X \) 与 \( Y \) 的协方差的定义为 \( \text{Cov}(X, Y) = E[(X - E(X))(Y - E(Y))] \)。
    \item 协方差性质有：
    \begin{itemize}
        \item \( \text{Cov}(X, Y) = E(XY) - E(X)E(Y) \)。
        \item \( \text{Cov}(aX, bY) = ab \text{Cov}(X, Y) \)。
        \item \( \text{Cov}(X, X) = D(X) \)。
    \end{itemize}
    \item 计算协方差可能用到的其他方法包括：
    \begin{itemize}
        \item 利用联合分布函数或密度函数计算 \( E(XY) \)。
        \item 利用边缘分布和条件分布计算 \( E(XY) \)。
    \end{itemize}
    \item 设 \( a \)，\( b \)，\( c \) 是常数，则 \( \text{Cov}(aX + bY + cZ) = a \text{Cov}(X, Y) + b \text{Cov}(Y, Z) + c \text{Cov}(Z, X) \)。
    \item \( X \) 与 \( Y \) 的相关系数 \( \rho_{XY} = \frac{\text{Cov}(X, Y)}{\sqrt{D(X)D(Y)}} \)。
    \item 计算相关系数可能用到的数字特征有：
    \begin{itemize}
        \item \( E(X) \)，\( E(Y) \)。
        \item \( D(X) \)，\( D(Y) \)。
        \item \( E(XY) \)。
    \end{itemize}
    \item \( X \) 与 \( Y \) 的相关系数 \( \rho_{XY} \) 应满足的条件有 \( -1 \leq \rho_{XY} \leq 1 \)。
    \item 当 \( X \) 与 \( Y \) 的相关系数 \( \rho_{XY} \) 满足条件 \( \rho_{XY} = 0 \) 时，则称 \( X \) 与 \( Y \) 不相关。
    \item 判断不相关的主要依据有：
    \begin{itemize}
        \item \( \text{Cov}(X, Y) = 0 \)。
        \item \( E(XY) = E(X)E(Y) \)。
    \end{itemize}
    \item 随机变量 \( X \) 与 \( Y \) 相互独立与不相关的关系是：
    \begin{itemize}
        \item 相互独立一定不相关，但不相关不一定相互独立。
    \end{itemize}
    \item 特例：若 \( X \) 与 \( Y \) 联合分布为正态分布时，相互独立等价于不相关。
    \item 随机变量 \( X \) 的各种矩的定义：
    \begin{itemize}
        \item 原点矩：\( \mu_k' = E(X^k) \)。
        \item 中心矩：\( \mu_k = E[(X - E(X))^k] \)。
        \item 混合矩：\( \mu_{ij} = E(X^i Y^j) \)。
    \end{itemize}
    \item 随机变量 \( (X, Y) \) 的协方差矩阵为：
    \[
    \begin{pmatrix}
    D(X) & \text{Cov}(X, Y) \\
    \text{Cov}(Y, X) & D(Y)
    \end{pmatrix}
    \]
    \item 二维正态分布 \( (X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho) \) 的数字特征：
    \begin{itemize}
        \item 边缘分布：\( X \sim N(\mu_1, \sigma_1^2) \)，\( Y \sim N(\mu_2, \sigma_2^2) \)。
        \item 条件分布：\( X|Y = y \sim N\left(\mu_1 + \rho \frac{\sigma_1}{\sigma_2}(y - \mu_2), \sigma_1^2(1 - \rho^2)\right) \)。
        \item 线性组合：\( aX + bY \sim N(a\mu_1 + b\mu_2, a^2\sigma_1^2 + b^2\sigma_2^2 + 2ab\rho\sigma_1\sigma_2) \)。
    \end{itemize}
    \item 请自行总结各类数字特征之间的关系。还注意一些特殊函数数学期望的计算方法，例如 \( E(X_i) \)，\( E(\max\{X_i\}) \)，\( E(\min\{X_i\}) \) 等。
\end{enumerate}

\section{第五章}
\begin{enumerate}
    \item 随机变量序列 \( \{X_n\} \) 依概率收敛的定义是：对于任意 \( \epsilon > 0 \)，
    \[
    \lim_{n \to \infty} P(|X_n - X| \geq \epsilon) = 0
    \]
    其中 \( X \) 是一个随机变量。
    \item 随机变量序列 \( \{X_n\} \) 服从大数定律的定义是：对于任意 \( \epsilon > 0 \)，
    \[
    \lim_{n \to \infty} P\left(\left|\frac{1}{n} \sum_{i=1}^{n} X_i - \mu\right| \geq \epsilon\right) = 0
    \]
    其中 \( \mu = E(X_i) \) 是随机变量 \( X_i \) 的期望。
    \item 三个大数定律的条件分别是：
    \begin{itemize}
        \item \textbf{弱大数定律（切比雪夫大数定律）}：随机变量序列 \( \{X_n\} \) 相互独立同分布，且 \( E(X_i) = \mu \)，\( D(X_i) = \sigma^2 < \infty \)。
        \item \textbf{强大数定律（柯尔莫哥洛夫大数定律）}：随机变量序列 \( \{X_n\} \) 相互独立同分布，且 \( E(X_i) = \mu \)，\( D(X_i) = \sigma^2 < \infty \)。
        \item \textbf{伯努利大数定律}：随机变量序列 \( \{X_n\} \) 是一系列独立的伯努利试验，且 \( P(X_i = 1) = p \)，\( P(X_i = 0) = 1 - p \)。
    \end{itemize}
    \item 三个大数定律的结论分别是：
    \begin{itemize}
        \item \textbf{弱大数定律}：样本均值 \( \frac{1}{n} \sum_{i=1}^{n} X_i \) 依概率收敛到总体均值 \( \mu \)。
        \item \textbf{强大数定律}：样本均值 \( \frac{1}{n} \sum_{i=1}^{n} X_i \) 以概率1收敛到总体均值 \( \mu \)。
        \item \textbf{伯努利大数定律}：样本频率 \( \frac{1}{n} \sum_{i=1}^{n} X_i \) 依概率收敛到总体概率 \( p \)。
    \end{itemize}
    \item 设随机变量序列 \( X_1, X_2, \dots, X_n \) 相互独立同分布，且 \( k \) 阶矩存在：\( E(X_i^k) = \mu_k \)，则
    \begin{itemize}
        \item \( \frac{1}{n} \sum_{i=1}^{n} X_i \xrightarrow{P} \mu \)（当 \( n \to \infty \)）
        \item \( \frac{1}{n} \sum_{i=1}^{n} X_i^k \xrightarrow{P} \mu_k \)（当 \( n \to \infty \)）
        \item \( \frac{1}{n} \sum_{i=1}^{n} (X_i - \mu)^2 \xrightarrow{P} \sigma^2 \)（当 \( n \to \infty \)）
    \end{itemize}
    \item 随机变量序列 \( \{X_n\} \) 服从中心极限定理的定义是：对于独立同分布的随机变量序列 \( \{X_n\} \)，当 \( n \) 趋于无穷大时，标准化的样本均值 \( \frac{\sum_{i=1}^{n} (X_i - \mu)}{\sigma \sqrt{n}} \) 的分布趋近于标准正态分布 \( N(0, 1) \)。
    \item 设随机变量序列 \( X_1, X_2, \dots, X_n \) 相互独立同分布，且期望、方差：
    \[
    E(X_i) = \mu, \quad D(X_i) = \sigma^2
    \]
    存在，则当 \( n \) 比较大时，由中心极限定理有：
    \begin{itemize}
        \item \( \sum_{i=1}^{n} X_i \) 的近似分布为 \( N(n\mu, n\sigma^2) \)。
        \item \( \frac{\sum_{i=1}^{n} X_i - n\mu}{\sigma \sqrt{n}} \) 的分布趋近于标准正态分布 \( N(0, 1) \)。
        \item \( P\left(\frac{\sum_{i=1}^{n} X_i - n\mu}{\sigma \sqrt{n}} \leq x\right) \approx \Phi(x) \)，其中 \( \Phi(x) \) 是标准正态分布的累积分布函数。
    \end{itemize}
    \item 中心极限定理的应用：
    \begin{itemize}
        \item 用于近似计算样本均值的分布。
        \item 用于估计样本均值的置信区间。
        \item 用于假设检验。
    \end{itemize}
    \item 中心极限定理的条件：
    \begin{itemize}
        \item 随机变量序列 \( \{X_n\} \) 相互独立同分布。
        \item 期望 \( E(X_i) = \mu \) 和方差 \( D(X_i) = \sigma^2 \) 存在且有限。
        \item 样本量 \( n \) 足够大。
    \end{itemize}
    \item 中心极限定理的结论：
    \begin{itemize}
        \item 当 \( n \) 趋于无穷大时，标准化的样本均值 \( \frac{\sum_{i=1}^{n} (X_i - \mu)}{\sigma \sqrt{n}} \) 的分布趋近于标准正态分布 \( N(0, 1) \)。
        \item 对于有限的 \( n \)，当 \( n \) 足够大时，样本均值 \( \frac{1}{n} \sum_{i=1}^{n} X_i \) 的分布可以用正态分布 \( N(\mu, \frac{\sigma^2}{n}) \) 近似。
    \end{itemize}
\end{enumerate}

\section{第六章：抽样分布}

\begin{enumerate}
    \item 设 \( X_1, X_2, \dots, X_n \) 是来自总体 \( X \) 的样本，则
    \begin{itemize}
        \item 样本均值 \( \overline{X} = \frac{1}{n} \sum_{i=1}^{n} X_i \)。
        \item 样本方差 \( S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X})^2 \)。
        \item 样本 \( k \) 阶原点矩 \( A_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k \)。
        \item 样本 \( k \) 阶中心矩 \( B_k = \frac{1}{n} \sum_{i=1}^{n} (X_i - \overline{X})^k \)。
        \item 除定义式外，样本方差常用计算公式还有 \( S^2 = \frac{1}{n-1} \left( \sum_{i=1}^{n} X_i^2 - \frac{1}{n} \left( \sum_{i=1}^{n} X_i \right)^2 \right) \)。
    \end{itemize}

    \item 设 \( X_1, X_2, \dots, X_n \) 是来自总体 \( X \) 的样本，总体均值 \( E(X) = \mu \)，总体方差 \( D(X) = \sigma^2 \)，则
    \begin{itemize}
        \item 样本均值 \( E(\overline{X}) = \mu \)，\( D(\overline{X}) = \frac{\sigma^2}{n} \)。
        \item \( E(S^2) = \sigma^2 \)。
    \end{itemize}

    \item 设 \( X_1, X_2, \dots, X_n \) 是来自正态总体 \( N(\mu, \sigma^2) \) 的样本，则
    \begin{itemize}
        \item \( E(\overline{X}) = \mu \)，\( D(\overline{X}) = \frac{\sigma^2}{n} \)。
        \item \( E(S^2) = \sigma^2 \)，\( D(S^2) = \frac{2\sigma^4}{n-1} \)。
    \end{itemize}

    \item \( \chi^2(n) \) 分布的定义：
    \begin{itemize}
        \item 若 \( Z_1, Z_2, \dots, Z_n \) 是独立的标准正态随机变量，则 \( \chi^2 = \sum_{i=1}^{n} Z_i^2 \) 服从自由度为 \( n \) 的卡方分布 \( \chi^2(n) \)。
    \end{itemize}

    \item \( t(n) \) 分布的定义：
    \begin{itemize}
        \item 若 \( Z \sim N(0,1) \) 且 \( \chi^2 \sim \chi^2(n) \) 且 \( Z \) 与 \( \chi^2 \) 独立，则 \( T = \frac{Z}{\sqrt{\chi^2/n}} \) 服从自由度为 \( n \) 的 \( t \) 分布 \( t(n) \)。
    \end{itemize}

    \item \( F(n, m) \) 分布的定义：
    \begin{itemize}
        \item 若 \( \chi_1^2 \sim \chi^2(n) \) 且 \( \chi_2^2 \sim \chi^2(m) \) 且 \( \chi_1^2 \) 与 \( \chi_2^2 \) 独立，则 \( F = \frac{\chi_1^2/n}{\chi_2^2/m} \) 服从自由度为 \( (n, m) \) 的 \( F \) 分布 \( F(n, m) \)。
    \end{itemize}

    \item 设 \( X \sim \chi^2(n) \)，\( Y \sim \chi^2(m) \)，且 \( X \) 与 \( Y \) 相互独立，则
    \begin{itemize}
        \item \( X + Y \sim \chi^2(n + m) \)。
        \item \( E(X) = n \)，\( D(X) = 2n \)。
        \item \( D(X - Y) = 2(n + m) \)。
    \end{itemize}

    \item 设 \( X \sim F(n, m) \)，则 \( \frac{1}{X} \sim F(m, n) \)。

    \item 随机变量 \( X \) 的 \( \alpha \) 分位点的定义：
    \begin{itemize}
        \item 若 \( P(X \leq x_\alpha) = \alpha \)，则 \( x_\alpha \) 是 \( X \) 的 \( \alpha \) 分位点。
    \end{itemize}

    \item 标准正态分布 \( N(0,1) \) 的 \( \alpha \) 分位点为 \( u_\alpha \)，当 \( \alpha \) 较小时，通常利用 \( u_{1-\alpha} = -u_\alpha \)。（对称性）

    \item \( \chi^2(n) \) 分布的 \( \alpha \) 分位点为 \( \chi^2_\alpha(n) \)，当自由度 \( n \) 较大时（\( n > 45 \)），\( \chi^2_\alpha(n) \approx n + z_\alpha \sqrt{2n} \)。

    \item \( t(n) \) 分布的 \( \alpha \) 分位点为 \( t_\alpha(n) \)，当 \( \alpha \) 较小时，通常利用 \( t_{1-\alpha}(n) = -t_\alpha(n) \)。（对称性）当自由度 \( n \) 较大时（\( n > 45 \)），\( t_\alpha(n) \approx z_\alpha \)。

    \item \( F(n, m) \) 分布的 \( \alpha \) 分位点为 \( F_\alpha(n, m) \)，当 \( \alpha \) 较小时，通常利用 \( F_{1-\alpha}(m, n) = \frac{1}{F_\alpha(n, m)} \)。（三反公式）

    \item 设 \( X_1, X_2, \dots, X_n \) 是来自正态总体 \( N(\mu, \sigma^2) \) 的样本，则
    \begin{itemize}
        \item \( \overline{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) \)。
        \item \( \overline{X} \) 与 \( S^2 \) 的关系是独立的。
        \item 当非零常数 \( C = \frac{\sigma}{\sqrt{n}} \) 时，\( \frac{\overline{X} - \mu}{C} \sim N(0,1) \)。
    \end{itemize}

    \item 与单正态总体有关的两个抽样分布定理是：
    \begin{itemize}
        \item \( \overline{X} \) 的分布。
        \item \( S^2 \) 的分布。
    \end{itemize}
    这两个定理在后续章节中的应用场合有：
    \begin{itemize}
        \item 假设检验。
        \item 区间估计。
    \end{itemize}

    \item 与双正态总体有关的两个抽样分布定理是：
    \begin{itemize}
        \item \( \overline{X} - \overline{Y} \) 的分布。
        \item \( \frac{S_X^2}{S_Y^2} \) 的分布。
    \end{itemize}
    这两个定理在后续章节中的应用场合有：
    \begin{itemize}
        \item 假设检验。
        \item 区间估计。
    \end{itemize}

    \item 由标准正态总体和一般正态总体，按照抽样分布的定义及抽样分布定理构建常用的统计量并确定分布的大致流程是：
    \begin{itemize}
        \item 确定总体分布。
        \item 确定样本统计量。
        \item 应用抽样分布定理。
        \item 确定统计量的分布。
    \end{itemize}
\end{enumerate}

\section{第七章：参数估计}

\begin{enumerate}
    \item 设 \( X_1, X_2, \dots, X_n \) 是来自总体 \( X \sim F(x; \theta) \) 的样本，其中 \( \theta \) 是未知参数，则未知参数 \( \theta \) 的矩估计法的基本原理是：
    \begin{itemize}
        \item 通过样本矩估计总体矩，从而得到参数的估计值。
    \end{itemize}
    设 \( X_1, X_2, \dots, X_n \) 是来自总体 \( X \sim F(x; \theta_1, \theta_2, \dots, \theta_k) \) 的样本，其中 \( \theta_1, \theta_2, \dots, \theta_k \) 是未知参数，则未知参数的矩估计法的主要步骤为：
    \begin{itemize}
        \item 计算样本矩。
        \item 建立矩方程。
        \item 解方程得到参数的估计值。
    \end{itemize}
    （理解和掌握总体矩、样本矩的定义；掌握矩估计的思想）
    若总体 \( X \) 的均值 \( E(X) = \mu \) 和方差 \( D(X) = \sigma^2 \) 都存在，则参数 \( \mu \) 和 \( \sigma^2 \) 的矩估计的通用结论为：
    \begin{itemize}
        \item \( \hat{\mu} = \overline{X} \)。
        \item \( \hat{\sigma}^2 = S^2 \)。
    \end{itemize}

    \item 设 \( X_1, X_2, \dots, X_n \) 是来自离散型总体 \( X \) 的样本，\( P(X = a_i) = p_i \)，其中 \( \theta \) 是未知参数，样本观测值为 \( x_1, x_2, \dots, x_n \)，则似然函数为：
    \[
    L(\theta) = \prod_{i=1}^{n} p_i
    \]
    设 \( X_1, X_2, \dots, X_n \) 是来自连续型总体 \( X \sim f(x; \theta) \) 的样本，其中 \( \theta \) 是未知参数，样本观测值为 \( x_1, x_2, \dots, x_n \)，则似然函数为：
    \[
    L(\theta) = \prod_{i=1}^{n} f(x_i; \theta)
    \]
    似然函数与样本联合概率函数的区别和联系是：
    \begin{itemize}
        \item 似然函数是关于参数 \( \theta \) 的函数，而联合概率函数是关于样本 \( x_i \) 的函数。
        \item 似然函数的最大值点即为参数的最大似然估计。
    \end{itemize}

    \item 设 \( X_1, X_2, \dots, X_n \) 是来自总体 \( X \sim F(x; \theta) \) 的样本，其中 \( \theta \) 是未知参数，则未知参数 \( \theta \) 的极大似然估计法的步骤是：
    \begin{itemize}
        \item 写出似然函数 \( L(\theta) \)。
        \item 对似然函数取对数，得到对数似然函数 \( \ln L(\theta) \)。
        \item 求对数似然函数的导数，并令其等于零，得到似然方程。
        \item 解似然方程，得到参数的极大似然估计值。
    \end{itemize}

    \item 极大似然估计法估计未知参数当似然方程无解时的处理方法是：
    \begin{itemize}
        \item 通过数值方法求解。
        \item 检查似然函数的性质，寻找最大值点。
    \end{itemize}

    \item 估计量无偏性的定义：
    \begin{itemize}
        \item 若 \( E(\hat{\theta}) = \theta \)，则称 \( \hat{\theta} \) 是 \( \theta \) 的无偏估计。
    \end{itemize}
    不论总体服从何种分布都有：
    \begin{itemize}
        \item \( \overline{X} \) 是 \( E(X) \) 的无偏估计。
        \item \( S^2 \) 是 \( D(X) \) 的无偏估计。
    \end{itemize}

    \item 估计量有效性的定义：
    \begin{itemize}
        \item 若 \( \hat{\theta}_1 \) 和 \( \hat{\theta}_2 \) 都是 \( \theta \) 的无偏估计，且 \( D(\hat{\theta}_1) < D(\hat{\theta}_2) \)，则称 \( \hat{\theta}_1 \) 比 \( \hat{\theta}_2 \) 更有效。
    \end{itemize}

    \item 估计量相合性的定义：
    \begin{itemize}
        \item 若 \( \hat{\theta}_n \) 是 \( \theta \) 的估计量，且 \( \hat{\theta}_n \xrightarrow{P} \theta \)（当 \( n \to \infty \)），则称 \( \hat{\theta}_n \) 是 \( \theta \) 的相合估计。
    \end{itemize}
    判断相合性的常用理论是：
    \begin{itemize}
        \item 弱大数定律。
        \item 强大数定律。
    \end{itemize}

    \item 双侧置信区间的定义是：
    \begin{itemize}
        \item \( P(\theta_1 < \theta < \theta_2) = 1 - \alpha \)。
    \end{itemize}
    单侧置信区间的定义是：
    \begin{itemize}
        \item \( P(\theta > \theta_1) = 1 - \alpha \) 或 \( P(\theta < \theta_2) = 1 - \alpha \)。
    \end{itemize}

    \item 区间估计枢轴变量法：
    \begin{itemize}
        \item 对于双侧置信区间估计基本流程是：
        \begin{enumerate}
            \item 找到枢轴变量 \( T \)。
            \item 确定枢轴变量的分布。
            \item 通过分布的分位点确定置信区间。
        \end{enumerate}
        \item 单侧置信区间估计的基本流程是：
        \begin{enumerate}
            \item 找到枢轴变量 \( T \)。
            \item 确定枢轴变量的分布。
            \item 通过分布的分位点确定置信下限或上限。
        \end{enumerate}
    \end{itemize}

    \item 单正态总体参数的区间估计：
    \begin{itemize}
        \item 设 \( X_1, X_2, \dots, X_n \) 是来自正态总体 \( N(\mu, \sigma^2) \) 的样本。
        \item 在置信度 \( 1 - \alpha \) 下，确定参数 \( \mu \) 和 \( \sigma^2 \) 的双侧置信区间和单侧置信区间。
        \item 枢轴变量及其分布：
        \begin{itemize}
            \item \( \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \sim N(0,1) \)（当 \( \sigma^2 \) 已知）。
            \item \( \frac{\overline{X} - \mu}{S / \sqrt{n}} \sim t(n-1) \)（当 \( \sigma^2 \) 未知）。
            \item \( \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) \)。
        \end{itemize}
        \item 双侧置信区间和单侧置信区间的计算方法：
        \begin{itemize}
            \item \( \mu \) 的置信区间：
            \begin{itemize}
                \item \( \sigma^2 \) 已知：\( \overline{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \)。
                \item \( \sigma^2 \) 未知：\( \overline{X} \pm t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} \)。
            \end{itemize}
            \item \( \sigma^2 \) 的置信区间：
            \begin{itemize}
                \item \( \left( \frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)} \right) \)。
            \end{itemize}
        \end{itemize}
    \end{itemize}

    \item 双正态总体参数的区间估计：
    \begin{itemize}
        \item 设 \( X_1, X_2, \dots, X_n \) 是来自正态总体 \( N(\mu_1, \sigma_1^2) \) 的样本，\( Y_1, Y_2, \dots, Y_m \) 是来自正态总体 \( N(\mu_2, \sigma_2^2) \) 的样本。
        \item 在置信度 \( 1 - \alpha \) 下，确定参数 \( \mu_1 - \mu_2 \) 和 \( \sigma_1^2 / \sigma_2^2 \) 的双侧置信区间和单侧置信区间。
        \item 枢轴变量及其分布：
        \begin{itemize}
            \item \( \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} \sim N(0,1) \)（当 \( \sigma_1^2 \) 和 \( \sigma_2^2 \) 已知）。
            \item \( \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{S_p \sqrt{\frac{1}{n} + \frac{1}{m}}} \sim t(n+m-2) \)（当 \( \sigma_1^2 = \sigma_2^2 = \sigma^2 \) 未知）。
            \item \( \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \sim F(n-1, m-1) \)。
        \end{itemize}
        \item 双侧置信区间和单侧置信区间的计算方法：
        \begin{itemize}
            \item \( \mu_1 - \mu_2 \) 的置信区间：
            \begin{itemize}
                \item \( \sigma_1^2 \) 和 \( \sigma_2^2 \) 已知：\( (\overline{X} - \overline{Y}) \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}} \)。
                \item \( \sigma_1^2 = \sigma_2^2 = \sigma^2 \) 未知：\( (\overline{X} - \overline{Y}) \pm t_{\alpha/2}(n+m-2) S_p \sqrt{\frac{1}{n} + \frac{1}{m}} \)。
            \end{itemize}
            \item \( \sigma_1^2 / \sigma_2^2 \) 的置信区间：
            \begin{itemize}
                \item \( \left( \frac{S_1^2}{S_2^2} \frac{1}{F_{\alpha/2}(n-1, m-1)}, \frac{S_1^2}{S_2^2} \frac{1}{F_{1-\alpha/2}(n-1, m-1)} \right) \)。
            \end{itemize}
        \end{itemize}
    \end{itemize}

    \item 注意总结双侧置信区间和单侧置信区间在计算中的相同之处和不同之处：
    \begin{itemize}
        \item 相同之处：都基于枢轴变量的分布。
        \item 不同之处：双侧置信区间使用双侧分位点，单侧置信区间使用单侧分位点。
    \end{itemize}
\end{enumerate}

\section{第八章：假设检验}

\begin{enumerate}
    \item 假设检验中的原假设和备择假设：
    \begin{itemize}
        \item 原假设 \( H_0 \)：通常表示总体参数等于某个特定值或多个总体参数之间没有显著差异。
        \item 备择假设 \( H_1 \)：通常表示总体参数不等于某个特定值或多个总体参数之间存在显著差异。
        \item 二者地位是否对等？如何正确地提出原假设？
        \begin{itemize}
            \item 原假设和备择假设的地位不对等。原假设通常是被保护的假设，而备择假设是需要证明的假设。
            \item 正确提出原假设的方法：
            \begin{itemize}
                \item 原假设通常是基于已有的知识或假设提出的。
                \item 备择假设通常是研究者想要证明的假设。
            \end{itemize}
        \end{itemize}
        \item 参数假设检验的 I 类和 II 类风险的定义：
        \begin{itemize}
            \item I 类风险（α风险）：在原假设 \( H_0 \) 为真时，错误地拒绝 \( H_0 \) 的概率。
            \item II 类风险（β风险）：在原假设 \( H_0 \) 为假时，错误地接受 \( H_0 \) 的概率。
        \end{itemize}
        \item 在假设检验过程中需要控制的是：
        \begin{itemize}
            \item 通常需要控制 I 类风险（α风险），即显著性水平 \( \alpha \)。
        \end{itemize}
        \item 参数假设检验中出现 I 类风险的概率是：
        \begin{itemize}
            \item 显著性水平 \( \alpha \)。
        \end{itemize}
    \end{itemize}

    \item 假设检验的基本原则包括：
    \begin{itemize}
        \item 小概率原理：如果某个事件在原假设下发生的概率很小，那么当这个事件实际发生时，我们有理由怀疑原假设的正确性。
        \item 显著性水平：预先设定一个小概率值 \( \alpha \)，作为判断是否拒绝原假设的依据。
        \item 检验统计量：根据样本数据计算的统计量，用于衡量样本数据与原假设之间的差异。
        \item 拒绝域：根据显著性水平 \( \alpha \) 确定的临界值，当检验统计量落在拒绝域内时，拒绝原假设。
    \end{itemize}

    \item 处理假设检验问题的主要步骤以及各步骤的基本原理是：
    \begin{enumerate}
        \item 提出原假设 \( H_0 \) 和备择假设 \( H_1 \)。
        \item 选择适当的检验统计量。
        \item 确定显著性水平 \( \alpha \)。
        \item 计算检验统计量的值。
        \item 根据显著性水平 \( \alpha \) 确定拒绝域。
        \item 将计算得到的检验统计量值与拒绝域进行比较，作出决策。
    \end{enumerate}

    \item 单正态总体的假设检验问题：
    \begin{itemize}
        \item 设 \( X_1, X_2, \dots, X_n \) 是来自正态总体 \( N(\mu, \sigma^2) \) 的样本。在显著性水平 \( \alpha \) 下，对参数 \( \mu \) 和 \( \sigma^2 \) 进行假设检验：
        \begin{table}[h!]
            \centering
            \begin{center}
            \begin{tabular}{|c|c|c|c|c|} % chktex 44
                \hline
                \textbf{假设} & \textbf{前提条件} & \textbf{检验统计量} & \textbf{拒绝域} & \textbf{类型} \\
                \hline
                \( H_0: \mu = \mu_0 \) & \( \sigma^2 \) 已知 & \( Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \) & \( |Z| > z_{\alpha/2} \) & 双侧 \\
                \hline
                \( H_0: \mu = \mu_0 \) & \( \sigma^2 \) 未知 & \( T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \) & \( |T| > t_{\alpha/2}(n-1) \) & 双侧 \\
                \hline
                \( H_0: \mu \geq \mu_0 \) & \( \sigma^2 \) 已知 & \( Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \) & \( Z < -z_{\alpha} \) & 单侧 \\
                \hline
                \( H_0: \mu \leq \mu_0 \) & \( \sigma^2 \) 已知 & \( Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \) & \( Z > z_{\alpha} \) & 单侧 \\
                \hline
                \( H_0: \mu \geq \mu_0 \) & \( \sigma^2 \) 未知 & \( T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \) & \( T < -t_{\alpha}(n-1) \) & 单侧 \\
                \hline
                \( H_0: \mu \leq \mu_0 \) & \( \sigma^2 \) 未知 & \( T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \) & \( T > t_{\alpha}(n-1) \) & 单侧 \\
                \hline
            \end{tabular}
            \end{center}
        \end{table}
    \end{itemize}

    \item 双正态总体的假设检验问题：
    \begin{itemize}
        \item 设 \( X_1, X_2, \dots, X_n \) 是来自正态总体 \( N(\mu_1, \sigma_1^2) \) 的样本，\( Y_1, Y_2, \dots, Y_m \) 是来自正态总体 \( N(\mu_2, \sigma_2^2) \) 的样本。在显著性水平 \( \alpha \) 下，对参数 \( \mu_1 - \mu_2 \) 和 \( \sigma_1^2 / \sigma_2^2 \) 进行假设检验：
        \begin{table}[h!]
    \centering
    \begin{tabular}{|c|c|c|c|c|}
        \hline
        \textbf{假设} & \textbf{前提条件} & \textbf{检验统计量} & \textbf{拒绝域} & \textbf{类型} \\
        \hline
        \( H_0: \mu_1 = \mu_2 \) & \( \sigma_1^2, \sigma_2^2 \) 已知 & \( Z = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} \) & \( |Z| > z_{\alpha/2} \) & 双侧 \\
        \hline
        \( H_0: \mu_1 = \mu_2 \) & \( \sigma_1^2 = \sigma_2^2 = \sigma^2 \) 未知 & \( T = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{S_p \sqrt{\frac{1}{n} + \frac{1}{m}}} \) & \( |T| > t_{\alpha/2}(n+m-2) \) & 双侧 \\
        \hline
        \( H_0: \mu_1 \geq \mu_2 \) & \( \sigma_1^2, \sigma_2^2 \) 已知 & \( Z = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} \) & \( Z < -z_{\alpha} \) & 单侧 \\
        \hline
        \( H_0: \mu_1 \leq \mu_2 \) & \( \sigma_1^2, \sigma_2^2 \) 已知 & \( Z = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} \) & \( Z > z_{\alpha} \) & 单侧 \\
        \hline
        \( H_0: \mu_1 \geq \mu_2 \) & \( \sigma_1^2 = \sigma_2^2 = \sigma^2 \) 未知 & \( T = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{S_p \sqrt{\frac{1}{n} + \frac{1}{m}}} \) & \( T < -t_{\alpha}(n+m-2) \) & 单侧 \\
        \hline
        \( H_0: \mu_1 \leq \mu_2 \) & \( \sigma_1^2 = \sigma_2^2 = \sigma^2 \) 未知 & \( T = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{S_p \sqrt{\frac{1}{n} + \frac{1}{m}}} \) & \( T > t_{\alpha}(n+m-2) \) & 单侧 \\
        \hline
        \( H_0: \sigma_1^2 = \sigma_2^2 \) & \( \mu_1, \mu_2 \) 已知或未知 & \( F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \) & 
        \begin{tabular}{c}
        \( F > F_{\alpha/2}(n-1, m-1) \) \\
        或 \\
        \( F < F_{1-\alpha/2}(n-1, m-1) \)
        \end{tabular} & 双侧 \\
        \hline
    \end{tabular}
\end{table}
    \end{itemize}

    \item 正态总体参数的单边假设检验与双边假设检验的拒绝域的区别：
    \begin{itemize}
        \item 单边假设检验的拒绝域只在分布的一侧，而双边假设检验的拒绝域分布在两侧。
        \item 单边假设检验的临界值通常是 \( z_{\alpha} \) 或 \( t_{\alpha} \)，而双边假设检验的临界值通常是 \( z_{\alpha/2} \) 或 \( t_{\alpha/2} \)。
    \end{itemize}

    \item 假设检验与区间估计有何区别及联系：
    \begin{itemize}
        \item 区别：
        \begin{itemize}
            \item 假设检验的目的是判断某个假设是否成立，而区间估计的目的是估计参数的取值范围。
            \item 假设检验的结果是接受或拒绝原假设，而区间估计的结果是一个置信区间。
        \end{itemize}
        \item 联系：
        \begin{itemize}
            \item 两者都基于样本数据进行推断。
            \item 两者都使用显著性水平 \( \alpha \)。
            \item 区间估计可以用来进行假设检验，反之亦然。
        \end{itemize}
    \end{itemize}

    \item 在假设检验的应用题中正确地提出原假设 \( H_0 \) 需要注意明确以下几个方面：
    \begin{itemize}
        \item 明确研究问题和目标。
        \item 确定原假设和备择假设的形式。
        \item 选择适当的检验统计量和显著性水平。
        \item 确保样本数据的代表性和可靠性。
    \end{itemize}
\end{enumerate}

\section{第九章：线性回归分析}

\begin{enumerate}
    \item 线性回归模型：
    \begin{itemize}
        \item 模型形式：\( Y = \beta_0 + \beta_1 X + \epsilon \)，其中 \( \epsilon \sim N(0, \sigma^2) \)。
        \item 未知参数 \( \beta_0 \) 和 \( \beta_1 \) 的最小二乘估计分别为：
        \[
        \hat{\beta}_1 = \frac{\sum_{i=1}^{n} (X_i - \overline{X})(Y_i - \overline{Y})}{\sum_{i=1}^{n} (X_i - \overline{X})^2}
        \]
        \[
        \hat{\beta}_0 = \overline{Y} - \hat{\beta}_1 \overline{X}
        \]
        \item \( \sigma^2 \) 的无偏估计为：
        \[
        \hat{\sigma}^2 = \frac{1}{n-2} \sum_{i=1}^{n} (Y_i - \hat{Y}_i)^2
        \]
        其中：
        \[
        L_{xx} = \sum_{i=1}^{n} (X_i - \overline{X})^2, \quad L_{yy} = \sum_{i=1}^{n} (Y_i - \overline{Y})^2, \quad L_{xy} = \sum_{i=1}^{n} (X_i - \overline{X})(Y_i - \overline{Y})
        \]
        \[
        Q_e = \sum_{i=1}^{n} (Y_i - \hat{Y}_i)^2
        \]
        \item 回归方程的形式是：
        \[
        \hat{Y} = \hat{\beta}_0 + \hat{\beta}_1 X
        \]
    \end{itemize}

    \item 设 \( \hat{\beta}_0 \) 和 \( \hat{\beta}_1 \) 分别是线性回归模型 \( Y = \beta_0 + \beta_1 X + \epsilon \) 中未知参数 \( \beta_0 \) 和 \( \beta_1 \) 的最小二乘估计，\( \hat{\sigma}^2 \) 为 \( \sigma^2 \) 的无偏估计。则有：
    \begin{itemize}
        \item \( E(\hat{\beta}_0) = \beta_0 \)，\( E(\hat{\beta}_1) = \beta_1 \)。
        \item \( D(\hat{\beta}_0) = \sigma^2 \left( \frac{1}{n} + \frac{\overline{X}^2}{L_{xx}} \right) \)，\( D(\hat{\beta}_1) = \frac{\sigma^2}{L_{xx}} \)。
        \item \( E(Q_e) = (n-2) \sigma^2 \)，\( E(\hat{\sigma}^2) = \sigma^2 \)。
    \end{itemize}

    \item 设 \( \hat{\beta}_0 \) 和 \( \hat{\beta}_1 \) 分别是正态线性回归模型 \( Y = \beta_0 + \beta_1 X + \epsilon \) 中未知参数 \( \beta_0 \) 和 \( \beta_1 \) 的最小二乘估计，\( Q_e = \sum_{i=1}^{n} (Y_i - \hat{Y}_i)^2 \) 为残差平方和，则有：
    \begin{itemize}
        \item \( \hat{\beta}_1 \sim N\left( \beta_1, \frac{\sigma^2}{L_{xx}} \right) \)。
        \item \( \frac{Q_e}{\sigma^2} \sim \chi^2(n-2) \)。
        \item \( \hat{\beta}_1 \)、\( \hat{\beta}_0 \) 和 \( Q_e \) 三者相互独立。
        \item \( \frac{\hat{\beta}_1 - \beta_1}{\hat{\sigma} / \sqrt{L_{xx}}} \sim t(n-2) \)。
    \end{itemize}

    \item 线性模型显著性检验的步骤是：
    \begin{enumerate}
        \item 提出原假设 \( H_0: \beta_1 = 0 \) 和备择假设 \( H_1: \beta_1 \neq 0 \)。
        \item 选择检验统计量 \( F = \frac{(\hat{\beta}_1 L_{xx})^2 / \sigma^2}{Q_e / (n-2)} \)。
        \item 确定显著性水平 \( \alpha \) 和对应的临界值 \( F_{\alpha}(1, n-2) \)。
        \item 计算检验统计量的值。
        \item 将计算得到的检验统计量值与临界值进行比较，作出决策。
    \end{enumerate}

    \item 回归系数的显著性检验：
    \begin{itemize}
        \item 提出原假设 \( H_0: \beta_1 = 0 \) 和备择假设 \( H_1: \beta_1 \neq 0 \)。
        \item 选择检验统计量 \( t = \frac{\hat{\beta}_1}{\hat{\sigma} / \sqrt{L_{xx}}} \)。
        \item 确定显著性水平 \( \alpha \) 和对应的临界值 \( t_{\alpha/2}(n-2) \)。
        \item 计算检验统计量的值。
        \item 将计算得到的检验统计量值与临界值进行比较，作出决策。
    \end{itemize}

    \item 回归方程的预测：
    \begin{itemize}
        \item 对于给定的 \( X = x_0 \)，预测值为 \( \hat{Y}_0 = \hat{\beta}_0 + \hat{\beta}_1 x_0 \)。
        \item 预测值的置信区间为：
        \[
        \hat{Y}_0 \pm t_{\alpha/2}(n-2) \hat{\sigma} \sqrt{1 + \frac{1}{n} + \frac{(x_0 - \overline{X})^2}{L_{xx}}}
        \]
    \end{itemize}

    \item 残差分析：
    \begin{itemize}
        \item 残差 \( e_i = Y_i - \hat{Y}_i \)。
        \item 残差图可以用来检查模型的假设是否成立，例如线性、独立性、正态性和方差齐性。
    \end{itemize}

    \item 多元线性回归模型：
    \begin{itemize}
        \item 模型形式：\( Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k + \epsilon \)。
        \item 未知参数的最小二乘估计通过矩阵运算得到。
        \item 模型的显著性检验和回归系数的显著性检验可以类似地进行。
    \end{itemize}
\end{enumerate}


\end{document}